樱桃繁殖效率低?基因组测序或能改变现状
第三章 蔷薇科
地表最强植物基因组文献解读,正在继续。科技君和小伙伴们特地对植物基因组领域已发的180多篇高质量文章进行收集、解读和归类,经归纳整理后共分十章,前九章为相关领域已发表物种文献解读,最后一章为植物基因组未来发展趋势及预测。
第三章往期回顾
甜樱桃是蔷薇科的果实作物,有着重要的经济价值。与此同时,樱桃也是水果作物育种计划的重要作物之一,但由于种植时间和空间的要求,其繁殖效率落后于谷类作物和蔬菜。本文中对于甜樱桃基因组及其相关分子标记的研究,将加速甜樱桃以及其他果树的遗传分析和育种计划。
文献题目:The genome sequence of sweet cherry (Prunus avium) for use in genomics-assisted breeding
发表期刊:DNA Research
发表时间:2017年5月25日
影响因子:5.477
摘要介绍:本文使用二代测序技术确定了甜樱桃(Prunus avium)的基因组序列。组装序列的总长度为272.4Mb,包含10,148个scaffolds,N50长度为219.6Kb。根据k-mer分析,这些序列覆盖了甜樱桃基因组的77.8%(甜樱桃基因组大小预估为约352.9Mb),其中包括>96.0%的核基因。研究人员预测了43,349个完整的蛋白质编码基因,并利用RADseq测序构建一份包含2,382个位点的高密度的一致性图谱,比较甜樱桃和桃的遗传图谱,揭示了两种基因组之间具有高度共线性;基于图谱和共线性策略将scaffolds连成假染色体。从6个现代品种的全基因组重测序发现1,016,866个SNPs和162,402个InDel,其中0.7%是有害的。序列变异以及简单的序列重复,可以作为DNA标记。识别出了和重要农艺性状相关的重要基因,这将加速对甜樱桃的遗传研究和育种计划。更多关于基因组序列和DNA标记的信息在DBcherry中可以找到。
研究难点:
1. 甜樱桃和桃之间非常保守,但基因组序列之间也存在分歧。虽然获得了1个保守的直系同源标记集合,但可用的标记数量有限,为了加速甜樱桃的育种计划,并协助未来的遗传学和基因组学研究,必须开发高通量的SNP基因分型系统以及甜樱桃的基因组资源库,包括全基因组序列数据、高密度遗传图谱、DNA分子标记等。
2. 确定基因组中和水果颜色、形态、质量和自交不亲和性相关的的重要农艺学基因。
内容简析
研究方向:
1. 甜樱桃的de novo基因组学研究;
2. 甜樱桃和蔷薇属近缘物种的基因组比较分析;
3. 甜樱桃遗传分子标记(SNP、InDel等)的研究;
4. 甜樱桃遗传图谱研究。
研究亮点:
1. 组装获得第一个甜樱桃的基因组序列;
2. 建立了甜樱桃基因组资源库,如全基因组序列数据、高密度遗传图谱,基于和桃遗传图谱共线性的甜樱桃假染色体,DNA分子标记(6个栽培种的全基因组重测序预测获得的SNP,简单序列重复序列(SSR),InDel);
3. 利用三个F1群体C-303、C-309和HRO,构建了甜樱桃的高密度连锁图谱;
4. 确定了基因组中和水果颜色、形态、质量和自交不亲和性的重要农艺学基因。
研究问题:
1. 甜樱桃基因组的大小和序列组装;
2. 甜樱桃基因组中所含的基因数目与分类注释;
3. 甜樱桃的遗传分子标记及遗传图谱;
4. 重要农艺性状(如抗病性、花、营养、水果品质等)相关的基因。
研究方法
研究对象:
基因组测序:Satonishiki(日本一个甜樱桃品种);
遗传多样性:Benikirari、Benisayaka、Benishuho、Benitemari、Beniyutaka和Nanyo;
所用软件:
PRINSEQ、fastx_clipper--数据过滤;
SOAPdenovo2 --组装;
BLASTN--比对;
RepeatMasker、RepeatScout--重复序列分析;
MAKER、BRAKER1、InterProScan、CD-hit、tRNAscan-SE--基因预测和功能注释;
MiSeq、Trinity--转录组测序和组装;
ddRAD-Seq、SAMtools、Bowtie 2、SnpEff、Applied Biosystems 3500、MapChart --遗传标记和遗传图谱;
MUMmer--假分子构建;
SNP2CAPS、SciRoKoCo、CAPVCFtools、PRIMER3--开发CAPSS、InDel和SSR标记;
所用数据:
1. 甜樱桃基因组de novo数据;
2. 6个栽培种的重测序数据和6条栽培线的RAD数据;
3. 蔷薇属数据库;
所用数据库:
Repbase、InterPro、GO、KOG、KEGG、GDR v2.0.a1、GDR v1.0p、GDR v2.0.a1等数据库;
实验过程:
使用DNeasy Plant Mini Kit(Qiagen,Hilden,Germany)从叶片中提取基因组DNA,并根据TruSeq DNA样品制备指南构建PE文库(插入片段大小:500Bp)。此外,使用GS Titanium Library构建了四个MP文库(插入大小为2Kb、5Kb、10Kb和15Kb)。在PE 93Bp模式下,用HiSeq2000(Illumina)进行测序。
研究结果
研究成果:
1. 在这项研究中,研究人员对甜樱桃进行了全基因组测序,组装得到第一个甜樱桃基因组草图,并构建了高密度的连锁图谱。利用全基因组重测序分析,揭示了栽培品系的遗传多样性。开发出了甜樱桃的DNA分子标记,包括SNP、InDel和SSR。此外,通过与蔷薇科属的比较分析,确定了和农艺相关的重要基因。这些信息将会促进甜樱桃的遗传和基因组研究,并辅助樱桃的分子育种。
2. 樱桃的基因组预估是350Mb,组装基因组(PAV_r1.0)大小为272.4Mb,覆盖基因组大小的77.8%。剩余的97Mb序列由于富含重复序列,从组装结果中删除了Contig长度<1000Bp的序列。蔷薇科中其他二倍体物种的基因组大小预估为:桃265Mb、日本梅280Mb、草莓240Mb,都比甜樱桃小100Mb。另外,PAV_r1.0重复序列的比例几乎和桃、梅、野草莓相同,约为43.8%。因此推测甜樱桃基因组PAV_r1.0的一部分序列可能对应于桃、梅、野草莓的基因组序列。PAV_r1.0注释获得了43,449个基因,包含96%的直系同源基因,表明PAV_r1.0充分覆盖了甜樱桃的基因组区域。
3. 为了将基因组序列锚定到甜樱桃染色体,研究人员利用ddRAD-Seq开发了三个F1群体C-303、C-309和HRO的高密度遗传图谱,构建了一份包含2,382个位点的高密度的一致性图谱。通过比较甜樱桃和桃的遗传图谱,发现它们在染色体水平上高度相似,因此桃的遗传学知识,可能也适用于甜樱桃。通过GWAS分析获得的在桃子上重要性状的直系同源基因可以通过序列相似性的方法,在甜樱桃基因组上进行标记。
4. 为了研究甜樱桃基因组中的序列和结构变异,对单一品系的6个品种进行全基因组重测序。共发现1,179,268个序列突变,包括1,016,866个SNP、162,402个InDel,密度分别是412/100kb、65.8/100kb。根据重测序获得的分子标记,成功设计了143,223个CAPS标记。在PAV_r1.0中共检测到85,731个SSR序列, 82,852 (96.6%)个成功设计为SSR分子标记。
5. 通过比较6个和农艺性状相关的基因,发现2个基因av_sc0000464.1_g250.1.br、PAV_sc0000493.1_g020.1.br分别是ppa016711m(桃皮色)、ppa027093m(桃肉色)直系同源物。此外,PAV_sc0000103.1_g380.1.mk和PAV_sc0001587.1_g070.1.mk分别为ppa010316m和ppa003772m的直向同源物,分别与果实长毛和形状相关联。PAV_sc0000024.1_g440.1.mk和PAV_sc0000600.1_g890.1.mk可能对应于ppa003772m(水果粘附和纹理)和ppa006339m(非酸果)。
6. 在本研究中,研究人员标记了40年间登记在日本山形县的6条栽培线(S1~S6)。由于甜樱桃和其他果树的育种需要时间和空间,难以进行高产育种。分子标记和表型之间的关联以及和特定生物性状相关的候选基因,为开展甜樱桃的分子标记辅助育种提供重要的基因资源。本研究所获得基因组信息将加速甜樱桃以及其他果树的遗传分析和育种计划。
图1 樱桃和桃的共线性图
X轴:桃的基因组(GDR v2.0.a1); Y轴:甜樱桃的基因组(PAV_r1.0),基因组序列间的相似性程度用不同的颜色表示
图2 品种Satonishiki在S1和S3的基因结构以及六条栽培线(S1~S6)序列的比对率
甜樱桃的自交不亲和性由S-locus 控制,S-locus分别携带S-核糖核酸酶和S -locus F盒蛋白(SFB)的基因作为雌性和雄性决定簇。Satonishiki拥有S3和S6单倍型,如所预期的那样,S3单倍型的S-RNase(Pav_sc0004475.1_g130.1.mk)和SFB(Pav_sc0004475.1_g100.1.mk)在单个contig(Pav_sc0004475.1)中被鉴定,S6(S- Rase :Pav_sc0006359.1_g040.1.mk;和SFB:Pav_sc0006359.1_g030.1.mk)在另一个contig(Pav_sc0006359.1)中被发现。在S3和S6单体型中,S -RNase和SFB之间的物理距离分别为7.4Kb和1.5Kb。在contig中预测的基因的方向和顺序都不是保守的,这表明S-loci的基因组结构是不同的。六条线上重测序的覆盖深度:当线条具有相同的S-单倍型到Satonishiki时,reads被均匀地映射到contig上。否则,覆盖率是局部的,表明基因组序列在不同的S-单倍型(例如S1,S4和S4')以及S3和S6中是不同的。
图3 甜樱桃和桃的遗传图谱比较分析
发现甜樱桃和桃之间在染色体水平上高度相似
图4 甜樱桃和其他蔷薇科遗传图谱的比较基因组学分析
甜樱桃的连锁群(用遗传图谱距离表示)和桃(A)、日本梅(B)、中国梨(C)、草莓(D)的比对分析。在甜樱桃2,317个定位SNP基因座中,侧翼序列与桃基因组中的2,280个位点具有显着的相似性,其次是日本梅2,194个,中国梨847个,草莓556个。甜樱桃连锁群根据桃染色体的名称编号。
表1 甜樱桃假分子的统计结果
【参考文献】
Kenta Shirasawa, Kanji Isuzugawa, Mitsunobu Ikenaga, Yutaro Saito, Toshiya Yamamoto, Hideki Hirakawa, Sachiko Isobe; The genome sequence of sweet cherry (Prunus avium) for use in genomics-assisted breeding, DNA Research, 2017. 12. 5.
撰稿:大项目部-王晓丽
编辑:市场部
猜你喜欢
IBC意犹未尽?彩蛋来袭!|180+篇植物基因组文章解读大全
近期热文
华大基因全球发布2项重大计划,引爆J.P.Morgan健康大会
国际顶级生物信息专家李恒博士出任BGI Online资深顾问
请继续关注“华大科技BGITech”公众号,
科技君将一如既往地为您提供精彩内容!
如有相关问题,欢迎后台留言~~
▼
关注华大科技,尽享精彩科研!